中国信通院孙明俊:人工智能进入后深度学习时代,AI+医疗期待大数据引爆
人工智能技术及发展趋势
当前,人工智能(AI)技术开始进入后深度学习时代,见图1。以深度学习为代表的AI技术在感知层面突破后开始演进,如图2所示。应用仍在追赶技术的步伐,并深入挖掘深度学习技术体系红利。投资规模降低、商业模式转变等多方面因素导致产业发展放缓。
图1 AI技术开始进入后深度学习时代
图2 深度学习吸收其他机器学习思想开始演进
虽然AI已经广泛用于日常生活中,但当前仍然处于弱AI阶段,强AI“道艰且长”。认知AI是实现强AI的必经之路,但缺乏突破,融合不同机器学习流派开始活跃,如图3所示。
图3 认知领域受到重视,多种流派再次活跃
在2019年,基于深度学习的视觉、语音、自然语言处理等研究仍占据主流,人们开始聚焦技术的“理解”,见图4。
图4 应用技术进一步提升,“看、听、说”能力增强
软件训练框架开始收敛,用于推断的专用芯片日益增多,如图5所示。
图5 训练框架及专用芯片发展趋势
AI应用门槛将不断降低,人人可用的AI技术将深刻改变人类生产生活。目前,AI研究持续火热态势,新技术和新算法百花齐放,我国学术界及产业界贡献巨大。以深度学习为代表的AI技术将对传统ICT技术产业体系带来深远影响。应用领域不断扩大,弱AI服务应用大放异彩,但强AI技术突破还需时日。
二我国人工智能应用及产业分析
我国AI产业生态初步形成。AI产业链的三个核心环节:上游是基础能力提供商,中游是服务及技术提供商,下游是应用提供商。但AI产业链的发展远远落后于发达国家。
互联网企业在AI领域率先发力。互联网巨头通过调整公司架构,推动技术创新,构建产业生态,投资、收购AI领先企业来布局AI。百度发布了度秘和自动驾驶汽车,推出开源平台Paddle。腾讯发布了新闻撰写机器人Dreamwriter,并推出了优图等图像识别工具。阿里推出了人智能平台DAPAI。
传统行业企业也开始利用AI进行转型升级。随着产业的升级和转型,IT巨头也借助AI推动智能化服务,提升企业的智能化水平。海尔以互联工厂智能制造为中心,打造开放生态系统。
初创企业爆发式出现。创新创业企业持续火热,在各行业领域抢占先机。在语音领域,有捷通华声、思必驰等;在图像和视频领域,有旷视科技、商汤科技等;在芯片领域,有寒武纪、深鉴科技等。
但人才发展形势严峻,缺口需求迫切。据WRP预测,美国产业人才总量约是中国的两倍。基础层人才数量是中国的13.8倍。AI产业的发展需要复合型人才,现有人才多是单一的专业背景,距离解决实际问题还有一定的距离。
AI成为新型基础设施,见图6。加快5G、工业互联网、AI、物联网等新型基础设施建设,提升传统基础设施智能化水平,构建高速、智能、泛在、安全、绿色的新一代信息网络,形成适应数字经济与实体经济融合发展需要的信息基础设施体系,未来发展可期。
图6 新型与传统基础设施对比
我国AI企业数量保持在全球第一梯队。截至2019年9月底全球活跃AI企业(总体上指对外提供产品、服务以及相关解决方案的企业)达5526家,其中2010年及之后成立的企业有4207家,中国大陆企业数量超过1200家,仅次于美国。我国AI专利授权量稳定增长。中国AI专利申请量全球占比超过90%,授权量全球占比40%。计算机视觉领域的申请量超过5万件,远超语音领域1.1万件和自然语言处理领域1.5万件。美国在各技术领域上的专利授权量上全面领先。我国顶级研究人才不足,全球AI学者数量Top20机构无一位于中国,11家位于美国,除微软和谷歌外全部为高校。
AI+工业:成为工业转型升级的助推剂。AI对工业领域具有巨大的赋能作用。2018-2025年全球制造业AI市场规模(亿美元),年CAGR超过50%。AI在各领域增加值总值(GVA)占比预测(2035,%),制造业增加值排名第一。如图7为四大技术(体系)聚焦十类工业场景。
图7 四大技术(体系)聚焦十类工业场景
AI+车联网,见图8:车端的AI应用为自动驾驶提供全面支撑。AI深入自动驾驶感知、决策交互与控制的各个环节,已成为公认核心关键技术。
图8 AI+车联网
AI+电信,见图9:已率先应用于网络运维,并逐步向管控领域发展。在运维领域,AI辅助节省大量人工,降本增效;在管控领域,AI充分释放网络潜能,实现的灵活、高效和自动化。
图9 AI+电信
三AI抗击疫情产品分析
人工智能技术全面渗透抗击疫情各环节。
图10
机器人、温测大数据分析为抗疫使用最热产品。
图11
“看”-AI 体温检测系统提供智能识别。图12
AI体温检测的关键在于红外体温。测温精度不足,仅可对人员进行初筛;受环境因素影响较大,远距离测温无法解决;测温精度修正成为AI未来的突破重点;相关技术和产品亟需制定标准规范。AI技术在复杂环境下的远距离红外测温方向上仍需深耕。
图13
AI测温系统产能不足,核心部件较国外存在差距。图14
“看”-AI看片,辅助医生诊断看片。当前医学影像处理中,肺结节检测等领域已经十分成熟,也是AI企业重要研究方向之一。得益于前期的积累,相关算法能够快速迁移应用于新冠肺炎疫情中。但是问题也很显然,各个医院的数据无法打通,且缺少有效标注数据;肺部影像辅助诊断发挥的实际效用有限,无法指导治疗环节。
图15 肺部影像分析系统
图16 主要技术
目前医学影像领域算法快速突破,算力持续增长,算法快速迭代,如何获取足够丰富且高质量的医疗数据成为提升诊断准确度的最关键因素。得益于深度学习算法的进步,图像识别能力不断提高,2015年Resnet算法识别错误率已经低于人眼的识别错误率,标志着算法在图像领域已经达到初步实用阶段。GPU作为高性能计算机集群协处理器,峰值性能优于FPGA,在医学影像领域应用也越来广泛。随着运算量的大幅度增加,为医疗影像商业化应用提供了强有力的支撑。高质量数据获取和标注能力是AI医学影像公司的核心竞争力。
我国医疗数据有数据量大、数据种类多、数据价值密度低等特征,但高质量数据获取难度大,高质量影像数据集中在少数三甲医院,缺乏有效的数据共享机制。过往医学影像数据,特别是影像所对应的临床诊断报告信息,没有以正确的标准化的形式记录甚至缺失的问题,对数据质量造成较大影响。数据标注成本高,数据处理中80%的时间都是在做数据预处理工作,标注的准确性关乎结果的准确性,训练的每张图片都需要经过专业人员标注,未来2-5年小样本学习在理论层面或将有所突破,但是短时间内数据的标注仍然需要耗费大量的精力。影像数据的获取能力与标注能力已经成为AI医学影像公司的核心竞争力之一。国内外公司基本都处于收集影像数据的阶段,以不断丰富病种多样性和扩大影像数据规模,从而优化影像智能诊断的准确度。“AI+医疗影像”期待大数据引爆。
“AI+医疗影像”市场百花齐放,产业目前仍处于发展期,尚未出现占据绝对优势地位的领跑企业。无论是国内还是国外,互联网巨头们都已经加快了在医疗人工智能领域的布局速度。在国外,IBM、谷歌和微软都已经布局多年。Facebook、苹果、亚马逊等巨头在人工智能领域也已经有长远考虑,不过他们还是主要布局在各自有竞争优势的行业,对于跨界应用于医疗行业的人工智能项目较少。在国内,BAT和科大讯飞为首的互联网巨头更看重医疗人工智能的市场,并且他们更倾向利用自身平台特点与优势的互联网技术来进行布局。挑战与前瞻:1)缺标准:CNDA尚无一例过审产品。目前已经有多项医学人工智能产品向国家药品监督管理局(CNDA)进行申报三类器械,但没有一个被批准;2)少人才:医疗人工智能发展亟需复合型人才。人工智能人才现在是短板中的短板,既懂医疗,又懂技术的复合型、战略型人才尤其短缺;3)基础差:技术与数据两大基石尚待巩固。一方面,医疗影像设备市场仍然被极少数的国际巨头所垄断着,仅仅西门子、通用电气、飞利浦三家就占据着75%的市场份额,而在高端领域,这一比例甚至超过80%之多。另一方面,在中国当前的医疗系统中,没有统一标准的临床结构化病历报告、医生手写病历不规范、临床用药、检查等细节缺失、患者离开医院后失访率高等各种原因造成健康医疗数据“误入误出”。
“听、说、写”-智能外呼/在线机器人可以减少工作量。技术框架如图17所示。
图17 外呼/在线机器人AI技术框架
AI+NLP,具备认知能力方能更懂用户所言所想,层级划分如图18所示。国内总体呈现出重应用/轻创新的问题,AI+NLP“基础建设”设施不全。优劣势明显。优势有:1)技术链齐备:在基础层/技术层/应用层上均有所布局;2)中文NLP技术:技术全面,对话系统、关键词识别、语义理解效果提升明显;3)数据资源丰富:收益于庞大的用户群,可通过社交媒体收集相关文本、对话、翻译数据。劣势有:1)AI基础层技术储备不足;2)高度依赖国外计算硬件,GPU、AI芯片等;3)模型算法自主研发能力欠缺,高度依赖国外开源技术;4)数据标注和技术评价缺少统一的标准和规范。
图18 AI+NLP层级
AI+NLP趋于全球化,中国技术/市场/数据各方因素利好数据各方因素利好。智能客服,以对话系统技术(见图19)为核心的典型产业生态齐全,呈现出百花齐放态势。
图19 对话系统典型应用
AI+NLP全球化趋势明显,国内技术成熟/市场庞大/数据丰富,客服产业迈在前列。麻省理工学院报告,在接受调查的90%的全球公司已将AI整合到客户服务和互动中,使得人工客服能够专注处理更高层次的任务。全球顾问Gartner研究:2020年,约有280万的美国客服坐席将发生重大改变,超过85%的客户互动将会在没有人工坐席的情况下处理。跨境零售集团玛莎百货运营人工智能迅速 处理客户投诉,该项技术已 投入到集团所有的英国商店及它们的13家呼叫中心。迪拜国民银行采用亚马逊网络服务AWS,用自然语言处理技术与客户进行交互,开发个性化的零售客户银行体验。
疫情影响下,人们对机器人的接受度和需求进一步升高。一方面这些机器人在开放环境下的能力仍然有限;随着使用增多,不可避免的安全性应该引起注意。对智能防控服务机器人产业链进行分析。智能防控服务机器人属医疗机器人子类医疗服务机器人类别。有配送运输,清扫消毒;移动跟随,引导带路;咨询问诊,对话传话等功能;有广泛采用新一代信息技术,集成了丰富的智能传感器,拟人化的活动交互能力等特点。随着智能服务机器人市场潜力加速释放,大量企业加入到激烈的市场竞争中,传统机器人厂商、科研院所、软件/科技巨头,智能机器人公司等多股力量开始向服务机器人领域汇聚。如图20所示。
图20 AI赋能防控服务机器人
智能防控服务机器人产业链主要包括上游的关键零部件、中游的软件与操作系统以及下游的产品集成与应用,如图21所示。在产业链上游,目前国外企业占据主导地位,国内厂商继续发力,核心零部件国产化的趋势逐渐显现。在产业链中游,主要为机器人提供核心软件,包括操作系统和AI核心技术。国内AI核心技术全球较为领先,智能语音语义、计算机视觉技术较好,操作系统和AI核心技术是提升用户体验,拉开产品差距的关键要素,在整个产业链中处于核心地位。在产业链下游,主要是集成上游提供的关键零部件和中游的核心技术,为机器人提供应用场景和服务能力,目前服务场景有限,有待进一步挖掘刚需市场。产业链开始往上游-下游模式过渡,下游企业在应用集成过程中也在不断创新发展,通过对AI核心技术的突破逐渐向产业链中游上探,中游企业也在往集成应用下探。
图21 智能防控服务机器人产业链
AI赋能协同办公系统,如图22所示,提升办公软件性能。AI技术主要是让在线办公系统更加智能,提供更优质的用户体验。网络质量预测。用于动态调整网络拓扑、编码方式等,保证通信质量。人脸识别技术验证身份,提升会议系统的安全性。对视频质量进行动态改善,提升交流体验。利用语音识别和翻译技术,实现会议字幕生成和翻译。AI在协同办公软件中可发挥的作用有待进一步挖掘。
图22 协同办公技术体系
国内在线办公起步较晚,但发展迅速且产业链条完整,如图23所示。国外在线办公软件起步较早,用户付费意愿较高。受到疫情影响,国内在线办公受到热捧,有望培养用户习惯,并形成可持续的商业模式。据国外机构Apps Run The World数据,2018年排名前10位的全球协作软件供应商占全球协作整体市场的55.7%,其中微软以占领20.8%的市场份额领跑市场,其次是思科、谷歌、LogMein和Slack。我国协同办公市场规模也呈逐年扩大趋势,据不完全统计,国内提供协同办公产品的企业约有500余家,2019年产业规模达到459.5亿元。即时通讯:国内互联网公司技术和市场成熟;微信、钉钉、飞书、蓝信等处于领先地位。音视频会议:Zoom和思科Webex占据龙头地位;国内飞书、钉钉等集成了会议功能,也有专注视频会议的随锐、全视通等。文档协同:微软凭借office软件在全球占据着先发优势;金山得益于WPS office 的深耕,市场占有率逐步提高。办公OA:国内办公OA历史较长,主要企业包括用友、SAP、金蝶、金和、致远互联、泛微等。适应国内习惯和需求,本土企业优势明显。
图23 在线办公产业链
人工智能抗疫产品仍然面临问题。由于缺乏规范标准的引导,产品总体质量良莠不齐,存在着较高的应用风险,如AI体温测量误差过大可能导致病例漏检,服务机器人识别和推荐信息不准确,会发生误导用户采取错误防疫措施的危险。一方面部分优秀产品由于宣传不到位未能得到有效关注;另一方面企业扎堆推出大量同质化产品,忽视了部分场景下的需求。市场中缺少可供双方对接需求的权威平台。人工智能技术在有数据、有积累的场景能够快速形成落地产品,但在其他缺少行业数据的场景发挥作用有限,提供公共行业数据服务的需求日益增大。
四AI产品评测与抗疫支撑
研究领域覆盖人工智能全产业链,建设开源生态、打造相关技术标准、推动可信AI落地,促进产业融合。
图24 人工智能技术体系
标准评测工作是促进人工智能行业健康发展的重要保障。得益于深度学习技术的突破,计算机视觉、自然语言处理算法等在部分领域已达到落地商用的水平。由于技术实力和成本等原因,导致市场上智能产品质量良莠不齐,甚至存在严重的安全漏洞等。针对人工智能产品的评估规范出台相对滞后,产业界需要第三方评估,进行规范和约束。为推动人工智能更好的赋能行业,增强用户采购和使用智能化产品的透明度,积极开展评测工作。
围绕人工智能标准和规范打造标准和评估评测服务能力。积极牵头和参与国内外标准制定,基于ITU-T SG13 SG16,IEEE、3GPP、CCSA TC1、TC11,AIIA标准组,评估工作组,立项在研标准数十项;关注和跟踪技术、产业发展动态,不断迭代相关标准和规范,满足市场需求;涵盖芯片、算法、服务平台、智能语音服务、计算机视觉服务、智能终端、智能手机等多个领域。人工智能关键技术和应用评测工业和信息化部重点实验室公布规范体系,如图25所示。针对产业界需求,建设专用的计算环境、评测数据集、测试实验室等能力;形成了计算和存储资源,专用环境,数据集等完整的测试能力。并建设人工智能评测平台,提升行业影响力,如图26所示。
图25 规范体系
图26 人工智能评测平台
重点评测领域1:AIIA DNN Benchmark工作目标:在芯片发展过程中,基于清晰指标的技术竞争可以帮助企业快速进步。AIIA DNN benchmark致力于客观地 反应 AI 加速器能力现状,所有度量指标旨在提供客观的比对维度。
工作方式:「版本迭代、不断丰富完善」,训练 +推断,端+云。
图27 评测框架
AIIA Benchmark能够促进产业技术优中选优,如图28所示。建立AIIA Benchmark体系,切实反映人工智能产业发展过程中的技术痛点,明确技术竞争方向,帮助在帮助全产业AI相关企业产品宣传、相关应用行业选型的同时,促进技术进步,使得应用/技术/系统能更贴合实际应用场景需求。主要包括三个方面:面向应用产业的benchmark(在研),面向基础应用技术的benchmark(在研),面向底层硬件/系统的AIIA DNN benchmark(已推出)。
AIIA针对基础应用技术在基于算法/解决方案赋能相应提供商的特定场景,构建明确技术需求的基准测试指标,以产业需求推动技术演进;针对AI技术赋能的行业,提供面向真实应用场景的评测指标与测试数据集,量化用户需求,真实反映产品能力;客观反应AI加速器/硬件系统能力实际应用现状,所有度量指标旨在提供客观的比对维度。基准测试结果可为应用企业提供选型参考,同时为芯片/硬件系统企业提供第三方评测结果。
图28 AIIA DNN benchmark项目
已发布三轮v0.5版本评估结果。其中端侧推断任务基准测试完成两轮共7款芯片,云侧推断任务完成首轮试评估共4款芯片,见图29。
图29 AIIA DNN benchmark结果
重点评测领域2:计算机视觉技术和产品图30
《计算机视觉应用智能化分级:第1部分:企业级智能人脸摄像机》。
评估规范起草单位名单:中国信息通信研究院、华为技术有限公司、北京易诚高科科技发展有限公司、重庆中科云从科技有限公司、南京新一代人工智能研究院、上海诺基亚贝尔股份有限公司。
图31 评估测试具体指标要求
测试方法:材料检查+技术测试。
测试能力:活体检测数据集+100人视频数据集(包括园区出入口、室内走廊等)。
测试情况:2019年9月23日,组织首轮评测,华为、云从、旷视三家企业参与测试。
重点评测产品:家用智能摄像头人形检测能力
《计算机视觉应用智能化分级:第2部分:家用智能摄像头人形检测能力》
评估规范起草单位:中国信息通信研究院、华为技术有限公司、南京新一代人工智能研究院、重庆中科云从科技有限公司、中兴通讯股份有限公司。
评估测试指标要求:1)准确率:进行多次测试,摄像头成功识别人形的次数占总测试次数的比值。2)响应时延: 摄像头从拍摄人形到识别的时延。时延越短,响应能力越强。3)有效识别距离: 摄像头能够进行有效人形检测的最大距离。
测试方法:技术测试
测试能力:真人数据集+非真人数据集
测试情况:2019年9月23日,组织首轮评测,登虹、海雀两家企业参与测试
重点评测领域3:智能语音技术和产品
AIIA相关技术和应用领域评估规范:《中文语音合成服务系统评估规范》、《中文语音识别服务系统评估规范》、《声纹识别(自动说话人)服务系统评估规范》、《智能音箱化等级指标要求和评估方法》、《机器翻译服务系统评估规范》、《智能客服系统 第1部分:功能指标要求和评估方法》
图32 智能语音语义技术和产业
图33 自然语音理解规范体系
重点评测产品:智能客服智能化等级评估图34 《智能客服系统第1部分: 功能指标要求和评估方法》
重点评测产品:机器翻译服务系统图35机器翻译服务系统评估规范
重点评测产品:中文语音合成服务系统《中文语音合成服务系统评估规范》AIIAPG 008-2019
评估规范起草单位:中国信息通信研究院,南京新一代人工智能研究院,中科院自动化所,科大讯飞,腾讯,思必驰,百度,搜狗。
首轮评测结果公开发布,2019年11月2日AIDC颁布证书腾讯、阿里、思必驰、同盾科技。
图36 主要评估指标和在线评测系统
重点评测产品:智能音箱智能化等级评估图37
重点评测领域5:智能空间愿景:建立客观公正的评测规范,获得智能空间解决方案智能化等级的评定模型,推动行业的规范化。
意义:推进空间智能化在房地产等领域的渗透与发展,打造房地产商、用户等共同受益的智能化产品及服务,产生良好的经济、社会和服务价值。
工作思路:建立智能空间的智能化等级评定规范,帮助家居、社区、养老、酒店、场馆等各类甲方建立更好的准入制度,规范产品落地等工作。
评测内容:对各空间场景解决方案的场景化服务能力、系统稳定性、可扩展性、安全性等进行评测。
重点评测领域 6:有害信息内容识别《网络治理能力评估规范第2部分:有害信息内容识别服务系统》
评估规范起草单位:中国信息通信研究院、网易、金山云、百度、网宿科技等。
评测指标:从系统基本信息披露和系统成熟度、服务质量评估三个维度评价内容识别服务系统,共涉及61个指标项,按照必选项达标情况和可选项划分,评定内容识别服务系统。
基本信息披露:主要包括系统名称、系统版本号、系统基本描述、系统功能、业务起始运营时间等。
系统成熟度:主要包括完整性评估、性能评估、组织完整性评估、开发性评估、可靠性评估、易用性评估。
服务质量评估:主要包括服务可审查性、服务计量准确性。
图38 评测数据集情况
重点评测领域7 :深度学习训练平台《深度学习平台功能要求和评估方法》V1.0
评估规范牵头单位:中国信息通信研究院
评估规范参与单位:腾讯、百度、中兴、华为、联通
首轮评测通过企业:华为、浩鲸科技、厦门渊亭科技
图39 评测指标
重点评测领域8:教育机器人智能化分级评估《智能教育机器人智能化分级第1部分:功能指标要求及评估方法》V1.0
评估规范牵头单位:中国信息通信研究院、南京新一代人工智能研究院
评估规范参与单位:优必选、鲸鱼机器人、DFROBOT等
图40 系列标准和评测指标
孙明俊,中国信息通信研究院云计算与大数据研究所人工智能部主任,工信部人工智能技术和应用评测实验室常务副主任,中国人工智能产业发展联盟总体组组长,南京新一代人工智能研究院院长,长期从事人工智能,云计算,多媒体系统研究工作,牵头负责了多项人工智能、云计算和视频通信标准,主持多项省部级课题,获得多项国家、省部级奖项。主编《人工智能浪潮》系列丛书。
End
防疫控疫显身手 复工复产高效能 | 第二批《“AI+先进制造业”助力疫情防控新技术新产品新服务推荐目录》发布
防疫抗疫战场的城市先行者——人工智能助力新冠疫情防控数据分析